2013/05/30

[摘譯] 檢驗生活

[原文] The Examined Life - The Economist

[摘譯]
GDP 長久以來一直被批評過度強調「金錢」的重要性,三年前開始, OECD (Organisation for Economic Co-operation and Development) 每年公布「更好的生活」指數(Better Life Index),作為另一種觀點。

BLI 追蹤11個類別中的24項指標,有像是「就業率」這種容易量化的,也有像「公民參與度」這種抽象的概念。此外,OECD 並不公布各國的得分,只公布排名。

經濟學人依據其中的10項指標,重新計算了各國最高與最低 10% 人口的得分,結果跟傳統印象差異不大,跟GDP排名其實也差不多。

[譯按]
BLI 網站的視覺化做得很棒,可以上去自定個項指標的權重,還蠻好玩的。有了這個指標,就知道該移民去哪裡了 XD

2013/05/29

[Data Analytics] 結構主義與資料分析

標題跟附圖好像都有點哲學味道,但是其實想要談的是資料分析。

附圖是孫隆基老師的「中國文化的深層結構」,是快20年前好友送我的生日禮物。時光芢苒,人事沉浮,那麼多年過去了,書的具體內容其實早已遺忘,最近因著工作的關係,又拿出來重讀。

作者在書名上就明確的表達了寫這本書的目的:尋找華人文化裡屬於「深層」的,比較不變的一些共同特徵。

孫老師是歷史學家,這本書的內容,採取的是結構主義的方法。簡單的說,就是從同一個系統的眾多現象當中,找出不斷反覆出現的特徵,作為「深層結構」。

暫且不論書中所描述的發現,「在現象中尋找反覆出現的特徵」這件事,其實也是資料分析裡常見的課題。

探索式的資料分析(exploratory data analysis)一般是用來為觀察資料做摘要的分析工具,包含了很多不同的統計分析方法與視覺化技巧,讓我們可以看到資料表面以外的內容。

主成分分析」(Principal Component Analysis, PCA)是探索式資料分析裡常用的方法之一,可以幫我們找出所觀察到的現象裡的「異」最常發生的向度,而這些稱之為「主成分」的少數幾個向度,也就形成了所觀察到現象裡的所謂的「結構」。

探索式資料分析涵蓋的方法很多,於此無法一一解釋,但是「使用這套分析方法」的本身,其實已經揭示了一種結構主意與存在主義的哲學意涵:觀察記錄的「存在」可以反映出某種真實的「本質」,而透過對反覆出現現象的詮釋,可以推導出現象背後的結構。

不知道有沒有人把李維史陀的研究手稿拿來做量化分析的,很好奇這些資料會不會讓我們看到那些原住民部落的另一種文化結構?

2013/05/20

[摘譯] 快樂的債 - 經濟學裡的人


[原文]

The debt to pleasure - The Economist

[摘譯]

諾貝爾經濟學獎得主 Daniel McFadden 認為,經濟學家應該對「消費選擇」理論進行翻修,並修正大部分對人的假設。

「擁有帝王的品味,對風險有敏銳的覺察,勇往直前的追求快樂」是傳統經濟學家假設的「人」。然而人在做選擇時的歷程相當複雜,應該可以參考更多心理學與神經科學的想法,來修正消費選擇理論。

最基本的,經濟學假設人的偏好是固定不變的,然而許多心理學研究都告訴我們,選擇的偏好是不斷變動的。「擁有感」,「選擇時的環境」,「信任」,甚至「選擇的數量」,都會巨幅的改變我們做選擇時的偏好。

Daniel McFadden 的想法挑戰了很多經濟學的基本假設,例如「選擇越多越好」、「透過觀察可以了解一個人的選擇偏好」等等,這些想法會讓經濟學變得更混亂,不過真實的世界難道不混亂嗎?


[譯按]

經濟學裡對人的假設有時候看起來不太合常理,有過於簡化、理想化的傾向,不亞於物理學對於現實世界的假設。(oops~ XD)

簡化的好處,在於可以更容易抓住抽象、高層次的概念,而越抽象的概念,在類推到其他現象時所受的限制越小,可以讓人對整個問題的大方向有比較宏觀的掌握。至於簡化的壞處很簡單,就是經過重重假設之後,問題的狀況已經和現實問題脫節,所以推導出來的結論也不容易直接應用到實際情況上。

經濟學家固然可以修正對人的假設,讓經濟學在處理人的問題上更具實用性,但是同時也會喪失一些過度理想化的好處。

2013/05/16

情境感知應用實作架構

之前寫過一些「情境感知」(Context Aware)應用的相關介紹(12),其實相關的研究相當多,從系統整合、其中元件的技術,到理論架構都有,也有不少中文的論述(例如資策會的介紹,以及許多的學術論文)。

日前有朋友問到實作方面的問題,所以把過去的一些經驗稍作整理。

基本上,設計一個情境感知的的服務或應用,首先要定義哪些情境需要被感知。這其實是個難度很高的問題,關係到整個服務或應用所提供的價值,屬於「戰略」的層次。要解答這個問題,「使用者中心設計」(user-centered design)的領域有很多不錯的方法可以參考,不過不在這篇文章討論的範圍。

一旦決定了要感知的情境,該如何設計這個機制呢?

以程式開發的觀點,對情境的感知可以視為一個「事件處理機制」(event handling),就像「擊點滑鼠右鍵」、「誤觸筆電的觸控板」,系統要能知道這件事情的發生,並且採取對應的措施。

一個情境被感知到之後,該採取什麼動作(event handler),同樣屬於「為使用者提供價值」的問題,所以這裡我們暫時聚焦在實作「事件聽取機制」(event listener)的基本原則。

要判斷一個事件是不是發生,可以透過幾種方是式處理。一是透過分析找出規則(rule-based),另一種是收集大量的資料讓機器自己學習規則(machine learning),當然實作上更常見的是兩者的混合(hybrid)。

以下是從前的工作筆記,只是基本原則,不見得適用於所有的狀況。

    - EventHandler: Void, do whatever necessary for the context
    - EventListener: Boolean, determine the context is happening or not
      - rule-based:
        - design by hands of experts
      - ML based:
        1. Set up a sensor recording interface
        2. Simulate the context to aware of
        3. Collect sensor data stream, and label each record with "in-context" and "not-in-context"
        4. Train a statistical model for the above data (collected in 3)
        5. Use the trained model as the decision rules in EventListener
      - Hybrid:
        - combining ML with some heuristic rules
  - Fine tuning with usability test


筆者一邊寫這篇,一邊在看 Google I/O 2013 的現場直播,發現新的 Android 已經把 activity recognition 的功能放入系統中,也就是說:android 系統本身就提供了幾種「行動狀態的感知」(靜止,行走,騎自行車,或是開車),開發者不需要再自己設計這幾種情境的事件聽取機制,只要直接呼叫系統功能即可。簡單的說,這篇相當程度是白寫了,真是好樣的, Google!

2013/05/13

[摘譯]博士論文該寫多長?

原文:http://beckmw.wordpress.com/2013/04/15/how-long-is-the-average-dissertation/

作者分析了 2007年 2,536 名完成博士論文的紀錄,分析所有論文的頁數(最短21頁,最長2002頁),平均長度為 177 頁。(譯按:不知道含不含圖表跟附錄?)




月份,是九月開學前最多。





前四名生產最多博士的領域:教育行政、電機、教育心理、心理學。









產生最多博士前50名的學門,博士論文長度的方塊圖。經濟學、數學、生物統計學的論文最短,人類學、歷史、政治的論文最長。




[譯按]

整體來說,結果跟 common sense 沒有差很多:跟數字有關的長度短,跟論述有關的頁數多。八月跟十二月是新學期開始前,所以這段時間遞交論文的人也最多。

其實,大多數的分析也不外如是:告訴我們一些我們已經知道的事情。

2013/05/09

無所不在的智慧生活


這裡記錄的是筆者自己最近的一點粗淺心得,。如果把科技發展的趨勢分成「裝置」跟「服務」兩個部分,目前主要的發展方向是「無所不在」(ubiquitous) 和「情境感知」(context-aware)。

在裝置方面,科技產品會以「無孔不入」的方式融入人們的生活,近期熱門的「穿戴式電腦」(Google 的眼鏡、Apple 及各家科技大廠的手錶、衣服... 等等)屬於個人裝置,而再擴展到生活環境裡,則是智慧環境、智慧生活的生態系。實際的使用情境,可以參考康寧 2012 年推出的 the future of life 系列,IBM 的 SmartPlanet 系列,或是 Microsoft / Intel 的 Intelligent systems

在服務上,科技產品提供的將會是更「個人化」的服務,而呈現的方式會是透過「情境感知」。科技產品會整合使用者身邊收集到的各種資訊,來預測使用者的習性和意圖,並且針對該意圖提供相對應的資訊或服務。目前可以看到的雛形產品有 Google Now,未來的目標則是跟智慧環境、智慧生活的生態系結合。

為了達到「無所不在」(ubiquitous)與「情境感知」(context-awared),使用者所使用的操作介面也會隨之演進,朝向「自然操作介面」(Natural User Interface, NUI)發展。目前已經應用愛產品上的有「觸控」、「語音」、「手勢」、「眼動」等等,而「思考控制」也已經有一些測試原型,然而無論如何,終極的目標還是「讓使用者不必學習,依賴直覺即可使用」。

作為前面幾個趨勢的一個實例,我們可以看看日本的「超人衣」:HAL (Hybrid Assistive Limb) 或 Honda 的 Robotic Legs,屬於穿戴式的裝置,會自動判斷使用者肢體動作的意圖,提供運動出力的輔助,使用者只需要穿上,然後隨意用動即可。因為是作為特殊用途的應用,所以比日常應用早一步實現。

這些裝置跟服務所要帶給人們的,基本上是一種「無所不在的智慧生活」:計算裝置和人工智能深入到生活之中,讓人的生活更加便利。然而,這個願景並不全然是那麼美好的。首先,無所不在的計算裝置,會給人的隱私帶來很大的威脅;其次,人的環境越聰明,人即使不變笨,智力的活動減少,過度依賴看不見的機器,也未必見得是好事。不過在這些問題嚴重到威脅人的幸福生活之前,這些趨勢大概是不會停止的。